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糖尿 病 足 溃疡 复发 风险 预测 模型 的 构建 : 
基于 Logistic 回归 、 支 持 向 量 机 和 BP 神经 网 络 模型 


张 娟 ， 李 海 芬 ， 李 小 曼 ， 姚 苗 ， 马 惠珍 ， 马 强 “ 


【 摘要 】 背景 全球 范围 内 糖尿 病 足 溃疡 (DFUs) 首次 复发 与 再 次 复发 率 逐 年 上 升 ， 且 早期 复发 风险 高 于 远 
其 风险。 导致 DFUs 复发 的 风险 因素 较 多 ， 目 前 缺乏 系统 的 筛选 ， 因 此 需要 探索 DFUs 复发 的 危险 因素 ， 以 便 早 期 识 
别 出 复 发 高 危 人 群 。 目 的 ”探讨 Logistic 回归 、 支 持 向 量 机 (SVM ) 和 BP 神经 网 络 ( BPNN ) 模型 在 糖尿 病 足 溃疡 
(DFUs ) 复发 风险 中 的 预测 价值 。 方 法 ”选取 2020 年 1 月 一 2022 年 12 月 在 宁夏 医科 大 学 总 医院 烧伤 整形 美容 科 和 
伤口 造 口 门诊 就 诊 的 DFUs 患者 390 例 作 为 开发 模型 的 研究 对 象 。 根 据 患 者 出 院 后 1 年 内 DFUs 是 否 复发 分 为 复发 组 
116 (fij (29.7% ) 和 非 复发 组 274 例 (70.3% ) 。 收 集 两 组 患者 的 一 般 资 料 包 括 社会 人 口 学 特征 、 病 史 评 估 和 临床 病例 
资料 并 进行 比较 ， 采 用 糖尿 病 足 部 自我 管理 行为 量 表 ( DFSBS ) 评估 患者 糖尿 病 足 部 自我 管理 行为 ， 采 用 慢性 病 风 险 
感知 问卷 评估 患者 DFUs 风险 感知 水 平 。 采 用 多 因素 Logistic 回归 分 析 探讨 DFUs 患者 出 院 后 1 年 内 DFUs 复发 的 影响 
因素 ; 将 患者 按照 70:30 划分 为 训练 集 和 测试 集 ， 运 用 Logistic 回归 变量 筛选 策略 ， 分 别 建立 Logistic 回归 、SVM 和 
BPNN 模型 ; 绘制 各 模型 预测 DFUs 复发 风险 的 受 试 者 工作 特征 ( ROC ) 曲线 ， 采 用 查 准 率 、 召 回 率 、 正 确 率 、Fl 指 
数 及 ROC 曲线 下 面积 (AUC) 比较 各 模型 的 预测 效能 。 结 果 ”两 组 DFUs 患者 年 龄 、BMI、 发 病 后 就 诊 时 间 、 住 院 时 
间 、 吸 烟 史 、 足 溃疡 分 级 、 受 累 足 趾 截 肢 史 、 溃 疡 位 置 在 脚底 、 独 居 、 足 部 存在 行走 障碍 、 溃 疡 因 外 伤 引起 、 躁 肪 指 
数 、 糖 尿 病 周围 神经 病变 、 下 上 肢 动 脉 潭 样 硬 化 、 多 重 耐 药 菌 感 染 、 糖 化 血红 蛋白 、 白 和 蛋白、 是 部 护理 行为 、 风 险 感知 
水 平 比 较 ， 差 异 均 有 统计 学 意义 ( P<0.05 ) 。 多 因素 Logistic 回归 分 析 结 果 显 示 , 住院 时 间 (OR-0.678, 9596CI (0.557, 
0.826) ，P<0.001] 、 溃 疡 位 置 在 脚底 COR-0.078, 9596CI (0.011, 0.541) ，P=0.010]、 独 居 [ OR=5.689, 95%CI 
(2.583, 10.726) ，P<0.001 ] 、 足 部 存在 行走 障碍 (OR-3.364, 9596CI (2.742, 5.638) ，P<0.001 ] 、 糖 尿 病 周围 神 
经 病变 [ OR=3.089，95%CI (1.156, 4.585) ，P=0.025 ] 、 下 胶 动 脉 粥 样 硬化 【OR=4.033，95%C1 (3.688，9.060 ) ， 
P«0.001 ] 多 重 耐 药 菌 感染 [ OR=3.241, 9596CIC 1.728 ,7.361 ) , P«0.001 ) HHE IMLE HC OR=0.209,95%C1( 0.065 , 0.669 ), 
P-0.008 ) 、 白 蛋白 [OR=2.038, 95%CI ( 1.515, 2.741 ) , P<0.001 ] 、 足 部 护理 行为 [OR=1.965，95%C7 (0.874, 3.208) , 
P=0.014 ] 和 风险 感知 水 平 [ OR=0.261 ,95%CK 0.197,0.825 ), P=0.002 是 DFUs 患 者 1 年 内 DFUs 复 发 的 影响 因素 ( P<0.05 )。 
Logistic 回归 、SVM 和 BPNN 模型 在 测试 集中 预测 DFUs 复发 风险 的 正确 率 分 别 82.0396, 94.8796, 87.1796, AUC 分 别 
为 0.843, 0.930, 0.800. Logistic 回归 、SVM 和 BPNN 模型 预测 DFUs 复发 风险 的 ROC 曲线 AUC 比较 ， 差 异 有 统计 学 
意义 (2Z=8.826，P<0.05 ) ; SVM 模型 预测 DFUs 复发 风险 的 ROC 曲线 AUC 高 于 Logistic 回归 和 BPNN 模型 ( Z=5.672, 
P=0.014; Z=2.767，P<0.001 ) 。 结 论 SVM 模型 预测 DFUs 患者 出 院 后 1 年 内 DFUs 复发 风险 的 正确 率 、 灵 敏 度 、 特 
异 度 、AUC 等 指标 均 较 好 ， 为 相对 最 优 的 模型 ， 建 议 进一步 推广 应 用 以 验证 预测 模型 的 效能 。 

【关键 词 】 糖尿 病 ; 足 溃疡 ; 糖尿 病 足 ; 复发 ; Logistic 模型 ; 支持 向 量 机 模型 ; BP 神经 网 络 模型 ; 影响 因素 


m 


分 析 

【 中 图 分 类 号 】 R587.1 【文献 标识 码 】 A DOI: 10.12114/j.issn.1007—9572.2023.0175 

【引用 本 文 】 张 娟 ， 李 海 芬 ， 李 小 曼 ， 等 . 糖尿 病 足 溃疡 复发 风险 预测 模型 的 构建 : 基于 Logistic 回归 、 支 
持 向 量 机 和 BP 神经 网 络 模型 [J] . 中 国 全 科 医 学 ，2023. DOL: 10.12114/j.issn.1007-9572.2023.0175. | Epub ahead of 


print Jal www.chinagp.net ] 


ZHANG J, LIH F, LIX M, et al. Construction of recurrence risk prediction model for diabetic foot ulcer on the basis of 
Logistic regression, support vector machine and BP neural network model [J] . Chinese General Practice, 2023. [ Epub ahead 


of print djs 


基金 项 目 : 宁夏 回族 自治 区 自然 科学 基金 项 目 ( 2022AAC03515 ) ; 宁夏 回族 自治 区 重点 研发 计划 项 目 ( 2020BEG03025 ) 
750001 宁夏 回族 自治 区 银川 市 ， 宁 夏 医 科大 学 总 医院 烧伤 整形 美容 科 

“通信 作者 : 马 强 ， 副 主任 医师 ; E-mail: 10901969@qq.com 

本 文 数字 出 版 日 期 2023-05-31 


202307.00695v1 


chinaXiv 


ChinaXiv 合 作 期 刊 


一 ee 
2 ， htpAwww.chinagp.net. E-mail:zgqkyxGchinagp.net.cn 中 BEJ 科 医学 EH 志 


Construction of Recurrence Risk Prediction Model for Diabetic Foot Ulcer on the Basis of Logistic Regression, Support 
Vector Machine and BP Neural Network Model ZHANG Juan, Ll Haifen, LI Xiaoman, YAO Miao, MA Huizhen, MA 
Qiang“ 
Department of Burn Plastic Surgery, General Hospital of Ningxia Medical University, Yinchuan 750001, China 
"Corresponding author: MA Qiang, Associate Chief Physician; E-mail: 10901969@qq.com 

[Abstract] Background The rates of first and multiple recurrence of diabetic foot ulcers ( DFUs ) are increasing 
annually worldwide, and the risk of early recurrence is higher than the distant recurrence. There are numerous risk factors for 
DFUs recurrence, and there is a lack of systematic screening. Therefore, there is a need to explore the risk factors for DFUs 
recurrence in order to identify high-risk population of recurrence at an early stage. Objective To explore the predictive value 
of Logistic regression ( LR ) , support vector machine ( SVM ) , BP neural network model ( BPNN ) in the recurrence 
risk of DFUs. Methods From January 2020 to December 2022, a total of patients with DFUs attending the burn plastic and 
wound ostomy outpatient department in General Hospital of Ningxia Medical University were selected as the research objects and 
divided into the recurrence group (n=116, 29.796) and non-recurrence group ( n2274, 70.396 ) according to the recurrence 
of DFUs within 1 year after discharge. General information was collected and compared between the two groups of patients, 
including sociodemographic characteristics, medical history assessment and clinical case information. The Diabetes Foot Self- 
care Behavior Scale ( DFSBS ) was used to assess the self-management behavior of diabetes foot in patients and chronic diseases 
risk perception questionnaire was used to assess the risk perception level of DFUs among patients. Multivariable Logistic regression 
analysis was used to explore the influencing factors of DFUs recurrence in patients within 1 year after discharge. The patients were 
divided into training and test sets according to the ratio of 70 to 30, the LR, SVM and BPNN recurrence risk prediction models 
were developed based on Logistic regression variable screening strategy. The receiver operating characteristic ( ROC ) curves of 
each model to predict the recurrence risk of DFUs were plotted, and the predictive efficacy of each model was compared using the 
precision rate, recall rate, accuracy rate, F1 index and area under curve ( AUC ) . Results There were significant differences 
in age, BMI, time to visit after onset, length of hospital stay, history of smoking, classification of diabetic foot ulcers, history 
of involved toe amputation, sole ulcer, living alone, walking impairment, ulcers due to trauma, ankle-brachial index, 
diabetic peripheral neuropathy, lower limb atherosclerosis, multidrug-resistant bacteria infection, glycated hemoglobin, 
albumin, foot care behaviour, level of risk perception in both groups of DFUs patients ( P«0.05 ) . Multivariable Logistic 
regression analysis showed that the length of hospital stay ( OR=0.678, 9596CI (0.557, 0.826) , P«0.001) , sole ulcer 

( OR-0.078, 95%CI (0.011, 0.541) ，P=0.010 , living alone ( OR=5.689, 9596CI (2.583, 10.726) , P«0.001] , 

walking impairment( OR-3.364, 9596CI( 2.742, 5.638 ) , P«0.001 ] , diabetic peripheral neuropathy OR-3.089, 9596 CI( 1.156, 
4.585) , P=0.025 ] , lower limb atherosclerosis ( OR24.033, 9596CI (3.688, 9.060) , P«0.001) , multidrug-resistant 
bacteria infection [ OR=3.241, 9596CI( 1.728, 7.361 ) , P«0.001 ) , glycated haemoglobin [ OR-0.209, 9596CI ( 0.065, 0.669) , 
P-0.008 ] , albumin ( OR-2.038, 9596CI (1.515, 2.741) , P«0.001) , foot care behaviour ( OR-1.965, 9596CI ( 0.874, 
3.208) , Pz0.014 ] and level of risk perception CORz0.261, 9596CI (0.197, 0.825) , P-0.002 ] were influencing factors 
of the recurrence of DFUs within 1 year ( P«0.05 ) . The accuracy rates of LR, SVM and BPNN models to predict the recurrence 
risk of DFUs in the test sets were 82.0396, 94.8796 and 87.1796, with AUCs of 0.843, 0.930 and 0.800, respectively. There 
were significant differences in AUC of ROC curves of LR, SVM and BPNN recurrence risk prediction models of DFUs ( Z-8.826, 
P«0.05 ) ; the AUC of ROC curve of SVM recurrence risk prediction model was higher than the LR and BPNN models ( Z-5.672, 
P-0.014; Z-2.767, P«0.001) . Conclusion SVM model can predict the recurrence risk of DFUs patients within 1 year after 
discharge with good accuracy rate, sensitivity, specificity, AUC and other indicators, which is the relative optimal model. It is 
recommended to further promote and apply the prediction model to verify its effectiveness. 

[ Key words ] Diabetes mellitus; Foot ulcer; Diabetic foot; Recurrence; Logistic models; Support vector machine; 


Back propagation neural network; Root cause analysis 


根据 国际 糖尿 病 协会 数据 ，2019 年 全 球 糖 尿 病 MBRR], DFUs 患者 的 终生 风险 达到 1596-2596! ， 
患 病 率 为 9.3%， 到 2045 年 将 升 至 10.995 ^ ,与 此 同 ”DFUs 患者 截肢 的 年 发 生 率 为 5.1%'' |。 有 研究 报道 即使 创 
时 ， 全 球 慢 性 创面 的 患 病 率 也 在 增加 ， 以 糖尿 病 足 溃疡 MAAA DFUs 在 一 年 内 复发 率 高 达 40%，3 年 复发 率 为 
( diabetic foot ulcers, DFUs ) 和 下 肢 静脉 溃疡 最 为 常见 2 。 5096-6096, 5 年 内 复发 率 为 65% pe 。 显 然 ，DFUs 预后 
DFUs 是 糖尿 病 最 严重 的 并 发 症 之 一 ， 可 导致 高 死亡 率 不 稳定 ， 易 复发 且 早 期 复发 风险 较 高 。 
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His RH Logistic 回归 建立 DFUs 复发 风险 预 
测 模 型 ，1 年 内 DFUs 复发 率 为 26.9%， 吸 烟 、 愈 伤 组 
织 、 足 部 肤色 异常 、 肝 腻 质 、 糖 尿 病 周围 神经 病变 和 和 冠 
心病 是 DFUs 复发 的 风险 因素 。CRAWFORD 等 ' ”的 研 
究 显 示 DFUs 史 、 无 法 感受 到 10 g 单 丝 和 没有 任何 足 踏 
板 脉搏 是 DFUs 复发 的 独立 危险 因素 。 最 近 ，AAN DE 
STEGGE 等 501 建立 了 DFUs 复发 风险 预测 模型 ， 模 型 1 
主要 针对 复发 性 足 底 溃疡 ， 模 型 2 主要 针对 无 法 识别 的 
重复 性 压力 引起 的 溃疡 。 以 往 研 究 中 DFUs 复发 风险 预 
测 模型 的 建立 方法 单一 ， 未 对 比 不 同 算法 的 预测 效能 ， 
在 此 情况 下 本 研究 运用 机 需 学 习 (machine learning, 
ML) 中 的 支持 向 量 机 (support vector machine, SVM ) 
和 BP 神经 网 络 (back propagation neural network, 
BPNN ) 开发 出 DFUs 复发 风险 预测 模型 ， 并 对 比 其 预 
测 效能 ， 以 便 临 床 医护 人 员 能 够 及 时 识别 出 有 复发 性 足 
溃疡 风险 的 患者 ， 指 导 临 床 医生 和 患者 进行 预防 性 治疗 
的 联合 决策 ， 最 终 达到 降低 DFUs 复发 风险 的 目的 。 
1 对 象 与 方法 
1. 研究 对 象 ”选取 2020 年 1 月 一 2022 年 12 HÆF 
夏 医 科大 学 总 医院 烧伤 整形 美容 科 、 内 分 泌 科 和 伤口 造 
口 门诊 就 诊 的 DFUs 患者 作为 开发 模型 的 研究 对 象 。 纳 
入 标准 : (1) 符合 《中 国 老 年 2 型 糖尿 病 防 治 临床 指 
南 ( 2022 年 版 )》 诊 断 标 准 ' 的 2 型 糖尿 病 患 者; (2) 
因 初 发 DFUs 而 就 诊 ; (3 ) 自 愿 参与 , 上 且 签 署 知 情 同意 书 。 
排除 标准 : C1 ) 糖尿病 合并 妊娠 或 特殊 类 型 糖尿 病 ; (2) 
合并 严重 恶性 肿瘤 等 危重 疾病 者 ; (3 ) 有 沟通 障碍 者 ; CA) 
有 精神 疾患 者 ; (5) 中 途 失 访 者 。 本 研究 获 批 宁夏 医 
科大 学 总 医院 伦理 审查 (编号: KYLL-2021-677) , 9 
入 研究 对 象 均 知情 同意 且 签 署 知 情 同 意 书 。 
L2 样本 量 计算 ”本 研究 共 纳 入 36 个 候选 预测 变量 ， 
根据 多 变量 预测 模型 透明 报告 对 样本 量 的 要 求 '“"  :， 阳 
性 结局 事件 数 至 少 是 候选 预测 变量 个 数 的 10 倍 及 以 上 ， 
即 本 模型 开发 至 少 需 要 360 个 DFUs 结局 事件 。 经 数据 
清洗 ， 本 研究 共 纳 入 390 例 DFUs 患者 为 研究 对 象 。 本 
研究 结局 变量 是 DFUs 愈合 出 院 后 1 年 内 是 否 复发 的 情 
况 。DFUs 复发 诊断 标准 参照 国际 糖尿 病 足 演 疡 工作 组 
(IWGDF) 指南 .和 《2020 IWGDF 指南 : 糖尿 病 足 
的 诊断 》 标 准 '“! : 既往 有 过 DFUs 史 的 患者 出 现 新 的 
足 溃 疡 ， 不 论 这 次 溃疡 发 生 的 部 位 与 上 次 是 否 相 同 。 随 
访 1 年， 以 初诊 DFUs 住院 诊治 且 演 疡 愈合 后 的 时 间 为 
起 点 ， 若 随访 期 内 同一 患者 DFU 多 次 复发 ， 则 仅 记 1 
次 ,患者 复发 信息 以 第 一 次 复发 时 收集 的 信息 为 参考 。 
根据 患者 出 院 后 1 年 内 DFUs 是 否 复发 分 为 复发 组 116 
例 ( 29.796 ) 和 非 复发 组 274 例 (70.396 ) 。 
13 ”观察 指标 
1.3.1 一 般 资 料 ”根据 研究 目的 及 内 容 ， 由 研究 小 组 通 


ChinaXiv 合 作 期 刊 


http:/www.chinagp.net E-mail:zgqkyx@chinagp.net.cn “3 


过 文献 回顾 、 预 调查 和 专家 建议 等 方式 自行 设计 一 般 资 
料 收 集 表 ， 内 容 包 括 社 会 人 口 学 特征 、 病 史 评 佑 、 临 
床 病例 资料 。 (1 ) 社会 人 口 学 特征 包括 性 别 、 年 龄 、 
BMI、 发 生 DFUs 后 就 诊 时 间 、 住 院 时 间 等 ; (2 ) 病史 
评估 包括 糖尿 病 病程 、 吸 烟 史 ( 每 天 至 少 抽 1 支 烟 ， 持 
续 或 累积 半年 以 上 且 仍 在 吸烟 “ ) 、 饮 酒 史 (每 周至 
少 饮酒 1 次 , 持续 或 累计 饮酒 半年 以 上 上 且 仍 在 饮酒 "1 )、 
DFUs 史 、 高 血压 病史 、 冠 心病 病史 、 糖 尿 病 周围 神经 
病变 、 糖 尿 病 视网膜 病变 、 糖 尿 病 崩 病史; (3) 临床 
病例 资料 包括 足 溃疡 分 级 、 足 部 皮肤 颜色 、 足 趾 受 累 、 
溃疡 位 置 在 脚底 、 足 部 腾 且 、 受 累 足 趾 截 肢 史 、 下 胶 动 
脉 嘱 样 硬化 、 独 居 、 足 部 存在 行走 障碍 、 淡 疡 因 外 伤 引 
起 、 躁 腕 指数 、 骨 髓 炎 、 多 重 耐 药 菌 感染 、 糖 化 血红 和 蛋 
A. AIAR, HEA, ME MEER, WARA, A 
细胞 计数 。 

1.3.0 糖尿病 足 部 自我 管理 行为 量 表 (Diabetes Foot 
Self-care Behavior Scale, DFSBS) ”采用 DFSBS 评估 糖 
尿 病 足 部 自我 管理 行为 ，DFSBS riri: ^ 研制 ， 
共 7 个 条 目 ， 其 中 “我 会 自己 〈 或 请 家 人 帮忙 ) 检查 脚 


底 ”“ 我 会 目 己 (或 请 家 人 帮忙 ) 检查 脚趾 终 ”“ 洗 脚 
时 我 会 自己 (或 请 家 人 帮忙 ) 清洗 脚趾 颖 ”“ 洗 脚 时 


我 会 自己 (或 请 家 人 帮忙 ) 探 干 脚趾 颖 ”4 个 条 目 调 查 
患者 过 去 7d 实施 足 部 自我 管理 行为 的 天 数 ， 设 为 0、 
1~2、3~4、5~6 和 7d，, 共 5 个 等 级 ,分别 评 为 1~5 分 ， 
ER 3 个 条 目 调查 患者 足 部 管理 行为 的 执行 频率 ， 按 照 
“从 不 ”“ 很 少 ”“ 有 时 ”“ 经 常 ”“ 总 是 ”， 分 别 评 
为 1~5 分 ， 量 表 总 分 为 7~35 分 ， 得 分 越 高 表示 足 部 自 
我 管理 行为 越 好 ， 量 表 Cronbach's a 系数 为 0.835, Œ 
测 信 度 为 0.916。 

1.3.3 ”慢性 病 风险 感知 问卷 ”采用 慢性 病 风 险 感 知 问卷 
评估 患者 DFUs KERA, VIR BITE US 编制， 
用 于 评估 慢性 病 患 者 的 风险 感知 ， 包 括 经 济 风险 、 身 体 
诊疗 风险 及 社会 心理 风险 ， 共 3 个 维度 12 个 条 目 。 采 
用 Likert-5 级 评分 法 评分 ， 从 “一 定 不 会 发 生 的 ”“ 不 
太 可 能 发 生 的 ”“ 可 能 会 发 生 的 ”“ 很 可 能 发 生 的 ”“ 一 
定 会 发 生 的 ”分 别 计 1~5 分 ， 总 分 为 12~60 分 ， 得 分 
越 高 表示 研究 对 象 的 医疗 风险 感知 水 平 越 高 。 该 问卷 的 
Cronbach's a 系数 为 0.833， 各 维度 Cronbach's a 系数 
为 经 济 风险 0.716、 身 体 诊 疗 风 险 0.769， 社 会 心理 风险 
0.781， 具 有 良好 的 信 效 度 。 

14 质量 控制 ”运用 医院 信息 系统 收集 临床 资料 ， 通 
过 电话 随访 、 门 诊 随访 与 院外 随访 管理 系统 相 结 合 的 方 
式 ， 记 录 患 者 DFUs 的 复发 情况 ， 随 访 时 间 为 1 年， 由 
临床 医生 、 糖 尿 病 专科 护士 或 伤口 专科 护士 判断 患者 的 
复发 情况 及 症状 的 严重 程度 。 收 集资 料 前 统一 在 烧伤 整 


形 美容 科 、 伤 口 造 口 门诊 和 内 分 泌 科 选派 3 名 糖尿 病 专 
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科 护 士 和 3 名 伤口 专科 护士 共 6 名 作为 资料 收集 员 ， 由 
研究 者 对 其 进行 同 质 化 培训 和 指导 ,包括 随访 资料 收集 
的 内 容 、 方 法 和 注意 事项 等 。 选 取 5 例 DFUs 患者 进行 
预 调查 以 完善 资料 收集 表 。 采 用 问卷 星 编制 《糖尿 病 足 
溃疡 问卷 调查 表 》， 运 用 金山 文档 编制 《糖尿 病 足 溃疡 
在 线 资料 收集 表 》， 通 过 以 上 两 种 途径 完成 资料 收集 。 
由 培训 合格 的 资料 收集 员 协 助 患者 作答 问卷 。 电 话 随访 
由 烧伤 整形 美容 科 护士 进行 ， 门 诊 随 访 在 伤口 造 口 门诊 
完成 ， 院 外 管理 系统 随访 由 内 分 泌 科 教育 护士 完成 。 
1.55 模型 构建 

1.5.1. 数据 初步 筛选 和 预 处理 ” 审核 数据 的 变量 特征 ， 
并 按 既 定 规则 进行 初步 筛选 : (1) 删除 每 列 数据 缺失 
占 比 >90% 的 变量 ; (2) 删除 每 列 单个 类 别 比 例 >90% 
的 变量 ; (3 ) 删除 每 列 变异 系数 (variable coefficient, 
CV) «0.05 的 变量 ; (4) 删除 不 合 逻 辑 的 异常 值 ， 连 
续 性 变量 的 缺失 值 用 中 位 数 填 补 ， 分 类 变量 的 缺失 值 用 
众 数 填补 。 

1.5.2 ”特征 及 算法 的 选择 ”本 研究 的 特征 选择 步骤 在 训 
练 数 据 集 中 ， 以 DFUs 1 年 内 是 否 复发 为 因 变 量 ， 其 他 
变量 为 自 变 量 进行 初始 逐步 Logistic 回归 分 析 ， 利 用 OR 
值 及 其 959%CI 等 指标 增加 模型 的 可 解释 性 。 将 单 因素 
分 析 中 P«0.05 的 预测 因子 纳入 多 因素 分 析 ， 最 后 使 用 
逐步 回归 确定 进入 模型 的 预测 因子 。BPNN 对 数据 资料 
分 布 无 严格 限制 ， 可 识别 变量 间 复 杂 的 非 线性 关系 ， 具 
有 很 强 的 自 适应 能 力 ， 且 有 高 度 的 容错 性 '"! 。SVM 是 
一 种 线性 和 非 线性 分 类 方法 ， 具 有 预测 可 靠 性 高 、 稳 定 
性 强 和 泛 化 能 力 强 等 优势 | 。 

1.5.3 ”模型 的 建立 及 评价 ”纳入 Logistic 回归 中 有 意义 
的 11 个 独立 预测 因素 ,构建 Logistic、BPNN 及 SVM JX 
今 预 测 模 型 ， 各 模型 训练 集 和 测试 集 按 70 : 30 比例 ， 
292 例 样 本 用 于 训练 ，98 例 样本 用 于 预测 。 以 受 试 者 
工作 特征 曲线 (ROC ) 曲线 下 面积 (AUC) 、 查 准 率 、 
正确 率 、 召 回 率 和 Fl1 值 作为 模型 评估 的 指标 ， 在 各 指 
标 结果 不 一 致 时 ， 以 AUC 作为 主要 参考 ， 其 中 AUC 为 
0.50~0.70 提示 预测 效果 较 差 ，AUC 为 0.70~0.90 提示 预 
测 效 果 中 等 ，AUC>0.9 提示 预测 效果 非常 好 。 

1.6 ”统计 学 方法 运用 Excel 导出 并 录入 数据 ， 采 用 
SPSS 25.0 及 MATLAB R2020b 分 析 数 据 。 正 态 分 布 的 定 
量 资料 以 (x+s ) 表示 ， 两 组 间 比 较 采 用 两 独立 样本 t 
检验 ; 非 正 态 分 布 的 定量 资料 以 MM (Ps. Pn) 表示 ， 
两 组 间 比 较 采 用 独立 样本 Mann-Whitney U 检验 ; 定性 
资料 以 频数 及 百分比 表示 ， 两 组 间 比 较 采 用 x ?检验 ， 
等 级 资料 比较 采用 Wilcoxon W 检验 。 采 用 SPSS 25.0 构 
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测 DFUs 复发 风险 的 ROC 曲线 ， 采 用 查 准 率 、 正 确 率 、 

4 BIS, FI 指数 及 AUC 评价 各 模型 的 预测 效能 。 运 
用 DeLong 检验 比较 各 模型 的 性 能 及 AUC 间 的 差异 。 以 
P<0.05 为 差异 有 统计 学 意义 。 

2 结果 

2.1 一 般 资料 比较 ”两 组 DFUs 患者 性 别 、 糖 尿 病 病 
旦 、 饮 酒 史 、 足 部 皮肤 颜色 、 足 部 脐 有 版 、 足 趾 受 累 、 高 
血压 病史 、 冠 心病 病史 、 糖 尿 病 视网膜 病变 、 糖 尿 病 肾 
JE, ARK, AIAR, ME EMR, WAEA, 

白细胞 计数 比较 ， 差 异 均 无 统计 学 意义 (P>0.05); 两 
组 DFUs 患者 年 龄 、BMI 、 发 病 后 就 诊 时 间 、 住 院 时 间 、 

吸烟 史 . 足 省 疡 分 级 、 受 累 足 趾 截 肢 史 ` 溃 疡 位 置 在 脚底 、 
独居 、 足 部 存在 行走 障碍 、 溃 疡 因 外 伤 引起 、 躁 肪 指数 、 
糖尿 病 周 于 神经 病变 、 下 肢 动 脉 粥 样 便 化 、 多 重 耐 药 菌 
感染 、 糖 化 血红 和 蛋白、 白 蛋 白 、 足 部 护理 行为 、 风 险 感 
知 水 平 比 较 ， 差异 均 有 统计 学 意义 ( P<0.05 ) ， 见 表 1。 
2.2 DFUs 患者 出 院 后 1 年 内 DFUs 复发 影响 因素 的 
多 因素 Logistic 回归 分 析 ”以 DFUs 患者 出 院 后 1 年 内 
DFUs 是 否 复发 为 因 变 量 ， 以 表 1 中 差异 有 统计 学 意义 
的 因素 : 年 龄 、BMI、 发 病 后 就 诊 时 间 、 住 院 时 间 、 吸 
烟 史 、 足 溃疡 分 级 、 受 累 足 趾 截 肢 史 、 溃 疡 位 置 在 脚底 、 
独居 、 足 部 存在 行走 障碍 、 淡 疡 因 外 伤 引起 、 躁 肽 指数 、 
糖尿 病 周围 神经 病变 、 下 上 肢 动 脉 粥 样 硬 化 、 多 重 耐 药 菌 
感染 、 糖 化 血红 蛋白、 白 和 蛋白 、 足 部 护理 行为 、 风 险 感 
知 水 平 为 自 变量 进行 多 因素 Logistic 回归 分 析 ( 各 变量 
赋值 情况 见 表 2 ) ， 结 果 显 示 ， 住 院 时 间 、 淡 疡 位 置 在 
脚底 、 独 居 、 足 部 存在 行走 障碍 、 糖 尿 病 周 围 神经 病变 、 
下 肢 动脉 粥 样 硬化 、 多 重 耐 药 菌 感染 、 糖 化 血红 蛋白 、 

白 蛋 白 、 足 部 护理 行为 和 风险 感知 水 平 是 DFUs 复发 的 
影响 因素 ( P<0.05 ) ， 见 表 3。 

23 三 种 模型 的 运行 结果 
2.3.1 Logistic 回归 模型 运行 结果 将 多 因素 Logistic 回 
归 分 析 有 统计 学 意义 的 11 个 影响 因素 作为 预测 模型 的 
输入 变量 。Logistic 回归 在 训练 集 上 的 拟 合 值 与 真实 值 
相 比 ， 其 预测 DFUs 患者 DFUs 复发 的 查 准 率 、 正 确 率 
和 AUC 分 别 为 83.26% 、81.41% 和 0.825。 

2.3.2 SVM 模型 运行 结果 ”以 DFUs 是 否 复 发 为 因 变 量 
(赋值 : 否 =0， 是 =1) ， 多 因素 Logistic 回归 分 析 筛 
选 出 的 变量 为 自 变 量 ( 赋值 同 表 2) ， 在 训练 集 上 建立 
SVM， 利 用 tune.svm ( ) 函数 ， 通 过 网 格 搜索 方法 ， 尝 
试 各 种 参数 组 合 以 寻找 最 优 参数 ，C 与 y 初始 取 值 范 
围 皆 为 (0.01，0.1，1，10，100) 。10 折 交叉 验证 错 
误 率 最 低 时 的 最 优 参数 为 C=100、y =0.01， 此 时 训练 


建 Logistic 回归 模型 预测 DFUs 复发 的 影响 因素 ， 采 用 
MATLAB R2020b 软件 构建 BPNN 和 SVM 模型 ， 模 型 的 
拟 合 优 度 采 用 Hosmer - Lemeshow 检验 ， 绘 制 各 模型 预 


集 SVM 预测 DFUs 患者 复发 的 查 准 率 、 正 确 率 、AUC 
分 别 为 97.20%、96.33% 和 0.940， 见 表 4。 
2.3 BPNN 模型 运行 结果 ”以 DFUs 是 否 复发 为 因 变 
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表 1 两 组 DFUs 患者 一 般 资料 比较 
Table 1 Comparison of general information between the two groups of patients with DFUs 
m» — M CPI CR) ) 年 龄 BMI MURRE “发病 后 就 诊 ”住院 时 间 。 吸烟 史 ”饮酒 史 
男 女 ( 岁 ) ( kg/m" ) (年 ) 时 间 Cd) (d) [ 例 (%)】[ 例 (%)] 
复发 组 116 55(47.4) 61(526) 58.8+129 223+1.2 13.4+19  72s15 242+3.6  73(629) 95(81.9) 
未 复发 组 274 152(55.5) 122(445) 57.7+92 232+1.4 114424 8.4+2.4 12.6+5.3 176(59.9) 200 (73.0) 
检验 统计 量 值 2.126 4.026° -2.298° 2.793" -4.870* 21.728" 2.060 3.507 
P 值 0.151 0.004 0.022 0.059 0.002 0.022 0.047 0.061 
"T EUST CU C96) ) 受累 足 趾 稚 上 肢 史 [ 例 ( 96 ) ) GANRE 足 部 皮肤 颜 。 足 部 及 用 
I 级 [级 全 级 TV 级 V 级 3 B 脚底 [ 例 (% )] 色 [ 例 (%)] Cf C96) ) 
复发 组 4(3.4) 17(147) 43(37.0) 35(302) 17(147) 57 (49.1) 61 (52.6) 69 (59.5) 47 (40.5) 56 (48.3) 
未 复发 组  62(22.6) 88(321) 74(270) 43(15.7) 7(2.6) 65 (23.7) 106 (38.7) 132 (48.2) 142 (51.8) 131 (47.8) 
仿 验 统计 量 值 57.628" 24.489 6.431 3.176 2.562 
P 值 <0.001 <0.001 0.011 0.053 0.374 
组 别 足 趾 受 累 。 ”独居 —— 足 部 存在 行走 “溃疡 因 外 伤 引 _ 躁 及 指数 【 例 【% ) ] ”高 血压 病史 。 冠 心病 病史 ”糖尿 病 周围 神 
[ 例 (%)] 【 例 ( 和 %) ] 障碍 [ 例 (%)] 起 [ 例 (%)] ES 良 [ 例 (%) ] 【 例 (%) ] 经 病变 [ 例 (% )) 
复发 组 56(48.3) 81(69.8) 103 (88.8) 90 (77.6)  70(603)  46(396) 67 (57.8)  59(509) 86 (74.1) 
未 复发 组 ” 132(48.2) 161(588)  171(624) 154 (56.2) 90 (32.8) 184(672) 130(474) 146 (533) 120 ( 43.8) 
检验 统计 量 3.819 4.240 27.149 5.571 25.470 3.468 0.192 30.108 
P f£ 0.072 0.039 «0.001 0.026 «0.001 0.063 0.661 «0.001 
组 别 糖尿 病 视网膜 糖尿 病 肾 病 下 肢 动脉 费 样 AREK 多 重 耐 药 菌 感 糖化 血红 蛋 ”总 胆 红 素 (M (Ps, HARE 
病变 [ 例 (%)] 史 [ 例 (%)] 硬化 [ 例 (%)] CA Coo) ) RAA) F C9) Ps) , pmol/L] ( g/L) 
复发 组 69 (59.5) | 40(345)  55(474) 85 (73.3) | 86 (741) 9.51+0.72 9.73 (7.70, 11.30) 34.47 + 3.03 
未 复发 组 122 (44.5) | 79 (288) | 99 (361) 124 (45.2) | 72(263) 7.62-0.75 9.05 (8.30, 11.52) 41.34€ 242 
检验 统计 量 5.564 1.227 4.342 2.403 71.954 23.079" -0.753* -23.825" 
P 值 0.273 0.268 0.037 0.301 <0.001 <0.001 0.438 <0.001 
组 别 MEF CM (Pas, 胆固醇 EA CM (Pys, FAETH CM (Pas, 足 部 护理 行为 [M ”风险 感知 水 平 [MM 
P5) , umol/L) ( mmol/L ) P4) , g/L) P4), x107L) (Ps, P5) , 41] (P5, P4) , 43) 
复发 组 ” 99.52(98.37, 103.77) 6.42+2.06 99.38 (88.75, 116.73) 10.03 (8.37, 12.64) 46.93 (32.74, 52.68) 31.34 (28.32, 42.37) 
未 复发 组 98.85 (97.95, 105.72) 6.80+2.14 99.05 (91.26, 115.73) 10.15 (7.53, 13.80) 63.83 (49.21, 82.34) 47.30 (39.74, 65.52) 
检验 统计 量 值 -0.726 0311* -1.772 -0.426" 3.6427 -2.146 
P 值 0.424 0.568 0.069 0.670 0.006 0.032 


E: “为 : 值 , ORT TOR ZR. 余 检 验 统计 量 值 为 x? 值 。 


量 (赋值 : 否 =0， 是 =1) ， 以 多 因素 Logistic 回归 分 
析 中 有 统计 学 意义 的 变量 为 自 变量 (赋值 同 表 2 ) ， 计 
量 资料 采用 标准 化 公式 ， 将 输入 层 协 变量 全 部 归 一 化 
处 理 为 (0，1) (区 间 的 变量 ) 输入 BPNN 模型 。 对 测 
试 集 预 测 的 正确 率 为 87.17%， 训 练 集 预测 的 正确 率 为 
88.64%， 见 表 4。 

24 三 种 模型 的 预测 价值 比较 三 种 模型 预测 患者 
DFUs 复发 的 ROC 曲线 均 具有 较 高 的 正确 率 ， 在 训练 集 
和 测试 集中 ,三 种 模型 预测 DFUs 复发 风险 的 ROC 曲线 
AUC 比较 结果 为 : SVM»Logistic 回归 >BPNN。 由 ROC 
曲线 可 知 ，SVM 在 训练 集 和 测试 集中 预测 患者 DFUs 复 
发 的 AUC 均 最 高 ， 测 试 集 中 的 AUC 为 0.930 (95%CI 
(0.916, 0.955) ] ， 且 正确 率 最 高 为 94.87%， 灵 敏 度 
为 0.99， 特 异 度 为 0.87，SVM 模型 整体 表现 较 另 外 两 


种 预测 模型 预测 效能 更 优 ,经 DeLong 检 验 ,Logistic 回归 、 
SVM 和 BPNN 模型 预测 DFUs 复发 风险 的 ROC 曲线 
AUC 比较 ， 差 异 有 统计 学 意义 (Z=8.826，P<0.05 ) ; 
SVM 模型 预测 DFUs 复发 风险 的 ROC 曲线 AUC 高 于 
Logistic 回归 和 BPNN 模 型 ,差异 有 统计 学 意义 ( Z=5.672， 
P-0.014; Z-2.767, P«0.001) ; Logistic 回归 模型 预测 
DFUs 复发 风险 的 ROC 曲线 AUC 高 于 BPNN 模型 ， 差 
异 有 统计 学 意义 (2Z=3.274，P=0.028 ) ， 见 图 1、 表 4。 
3 讨论 

DFUs 复发 是 糖尿 病 患 者 不 良 预后 的 重要 标志 '" |。 
本 研究 关注 引起 DFUs 复发 的 主客 观 变量 ， 自 行 研制 
DFUs 复 发 高 危 因 素 在 线 筛 查 表 , 短期 随访 ( 出 院 后 1 年 ) 
DFUs 患者 的 复发 状况 ， 运 用 机 需 学 习 算 法 探讨 DFUs 
复发 的 风险 因素 ， 构 建 出 复发 风险 预测 模型 以 便 实 现 
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R2 DFUs 复发 影响 因素 的 多 因素 Logistic 回归 分 析 赋值 表 快速 第 查 ， 旨 在 为 糖尿 病 高 危 足 DFUs 复发 提供 全 面 的 


Table 2 Assignment table for multivariable Logistic regression analysis of 精准 干预 本 研究 DFUs Œ 者 中 院 后 1 年 内 的 复发 率 为 
^o S /ev iG C/O y eR 


influencing factors of DFUs recurrence 


— — TW ue — — —- 29349, AFERE DFUs 1 年 复发 率 为 26.9% 的 研 
DFUs 复发 E=1, 8-0 究 结果 ， 低 于 WANG 4! 和 JIANG 等 '" 报道 的 治愈 
年 龄 实测 值 
BMI 实测 值 
发 病 后 就 诊 时 间 实测 值 
住院 时 间 实测 值 
吸烟 史 有 =1, 无 =0 
EIAN m W a uc p 
受累 足 趾 截 肢 史 有 =1, 无 =0 
溃疡 位 置 在 脚底 R1. 8-0 
独居 是 =l, fi-0 -= - -SVM 模型 
足 部 存在 行走 障碍 是 =1, 否 =0 =- - -BPNN 模型 
溃疡 因 外 伤 引起 是 =1, 否 =0 == = Logistic 回归 模型 
icd eid 0 01 02 03 04 05 06 07 08 09 10 
糖尿 病 周 围 神经 病变 有 =1, 无 =0 JEN SN 
下 肢 动脉 粥 样 硬化 有 =1, 无 =0 
多 重 耐 药 菌 感染 有 =1, 无 =0 
糖化 血红 蛋白 实测 值 
HEH 实测 值 
足 部 护理 行为 实测 值 
风险 感知 水 平 实测 值 


表 3 DFUs 复发 影响 因素 的 多 因素 Logistic 回归 分 析 


Table 3 Multivariable Logistic regression analysis of influencing factors of " = = -SVM 模型 
DFUs recurrence | z - - -BPNN 模型 
Ja - ~ - Logistic 回归 模型 
自 变 量 B SE Mr pii 0R 值 95%6C1 ogistic 回归 模型 
常量 -8.932 1.253 48.637 «0.001 1.005 — 0 01 02 03 04 05 06 07 08 09 L0 
年 龄 0.088 0.072 1507 0220 0.916 (0.795, 1.054) i L = LE 
os IT a iiie 注 : A 图 为 训练 集 ROC 曲线 ，B 图 为 测试 集 ROC 曲线 ; SVM= 
BMI 0287 0.376 0.584 0445 1333 (0.608, 2.783) 支持 向 量 机 ，BPNN-BP 神经 网 络 。 
发 病 后 就 诊 时 间 ”0.086 0233 0.138 0.510 1.090 (04691, 1.720) 图 1 Logistic EIJI, SVM 和 BPNN 模型 训练 集 和 测试 集 预测 DFUs 复 
住院 时 间 -0.388 0.101 14.901 «0.000 0.678 (0.557, 0.826) 发 风险 的 ROC 曲线 
吸烟 史 4.147 3647 1293 0256 1.532 1250, 1558) Figure 1 ROC curves of Logistic Regression, SVM and BPNN recurrence 
足 溃疡 分 级 4104 0392 risk prediction models for DFUs in the the training and test sets 
pu — m A k == = 
受累 足 趾 截 肢 史 1434 0918 2437 0.119 0.838 (0.802, 1.007) 
BARLETE 2.550 0989 6666 0010 1478 (1239, 1.645) 3&4 Logistic 回归 、SVM 和 BPNN 模型 对 DFUs 复发 风险 的 预测 性 能 
| "i 比较 
E 
UL 2535 1049 5833 «0001 5689 (2583, 10/726) Table 4 Comparison of predictive performance of Logistic Regression, 
是 部 存在 行走 障碍 1.599 0.249 4.640 «0.001 3.364 2.742, 5.688) SVM and BPNN recurrence risk prediction models for DFUs 
溃疡 因 外 伤 引起 。 0.961 0.700 1.844 0.170 0382 (0.097, 1.509) 训练 集 测试 集 
WIS 0.578 1.42 0.186 0.667 0.782 (0.715, 0.974) 评价 指标 Logistic SVM BPNN — Logistic SVM BPNN 
糖尿 病 周围 神经 病变 0.085 0490 — 6107 0.025 3.089 (1.156, 4585) 回归 模型 ”模型 ”模型 ”回归 模型 ”模型 ”模型 
下 上 肢 动脉 缠 样 硬化 3.527 1.134 9.678 «0.001 4.033 — (3.688, 9.060) 查 准 率 (%) 83.26 97.20 92.70 84.42 97.06 96.00 
多 重 耐 药 菌 感 染 1.799 0916 4584 «0001 3241 (1728, 7361) 召回 率 (%) 80.95 89.74 65.40 79.16 86.84 60.50 
糖化 血红 蛋 上 1.568 0.595 6.938 0.008 0209 (0.065, 0.660) 正确 率 (%) 81.41 — 96.33 88.64 — 8203 09487 8717 
HARE -0712 0.151 22.182 «0.0001 2038 (1515, 2741) FI 指数 0.82 0.97 0.92 0.81 0.96 0.91 
足 部 护理 行为 -2.324 0437 52396 0014 1965 (0874, 3208) AUC 0.825 0.940 0.820 0.843 0.930 0.800 
风险 感知 水 平 -1.683 0.193 34.071 0.002 0261 — (0.197, 0.825) 灵敏 度 0.97 | 0.99 0.98 0.97 0.99 — 1.00 


ik: 一 表示 无 此 项 数据 。 特异 度 0.81 0.90 0.5 0.78 0.87 0.71 
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后 DFUs 1 年 内 再 发 病 率 为 31.6%， 且 低 于 HICKS 45 7 
的 研究 结果 。 目 前 各 区 域 性 医疗 机 构 有 关 DFUs 复发 率 
的 报道 有 所 不 同 '**1 ， 究 其 原因 与 医疗 卫生 技术 、 居 
民生 活 经 济 水 平 、 区 域 性 糖尿 病 防治 教育 普及 程度 、 
糖尿 病 高 危 足 筛 查 及 精准 诊疗 等 因素 有 关 。 提 前 对 高 危 
足 进行 筛 查 和 防治 对 预防 DFUs 复发 尤为 重要 '*”|。 通 
过 数据 挖掘 技术 形成 的 预测 模型 有 助 于 在 院外 尽早 识别 
DFUs 复发 的 危险 因素 ， 可 及 时 发现 DFUs 好 发 的 患 病 
高 危 人 和 群 ， 对 高 危 人 群 实施 干预 措施 ， 对 于 有 严重 复杂 
并 发 症 的 DFUs， 可 启动 快速 转 诊 路 径 ， 送 往 专业 的 足 
病 治疗 中 心 ， 对 提高 人 群 健康 水 平 意义 重大 。 

本 研究 从 简单 个 人 水 平和 复杂 临床 水 平分 别 筛选 出 
与 DFUs 复发 相关 的 影响 因素 ， 运 用 机 需 学 习 算 法 建立 
最 优 预测 模型 ， 最 后 进行 模型 评价 。 多 因素 Logistic [Hl 
归 分 析 结 果 显 示 ， 住 院 时 间 、 演 疡 位 置 在 脚底 、 独 居 、 
足 部 存在 行走 障碍 、 糖 尿 病 周围 神经 病变 、 下 有 歧 动脉 嘲 
样 硬化 、 多 重 耐 药 菌 感染 、 糖 化 血红 蛋白 、 白 蛋白 、 足 
部 护理 行为 和 风险 感知 水 平 是 DFUs 患者 1 年 内 DFUs 
复发 的 影响 因素 ,与 大 多 数 研究 结果 相符 "1 ， 
Ai. 3 DFUs 复发 的 早期 筛 查 与 防治 提供 了 可 行 干预 方 
案 。 

目前 ， 许 多 关于 DFUs 复发 风险 的 研究 常 使 用 传统 
或 常见 的 机 器 学 习 算 法 建立 模型 ， 很 少 采用 多 种 机 器 学 
习 算 法 进行 多 样 化 建 模 来 比较 模型 预测 性 能 。 本 研究 预 
测 模型 指标 筛选 共 纳入 36 个 变量 ， 将 多 因素 Logistic E 
归 分 析 中 有 统计 学 意义 的 11 个 因素 纳入 模型 构建 ， 分 
别 建立 Logistic 回归 、SVM 与 BPNN 风险 预测 模型 ， 并 
且 在 测试 集中 评估 了 三 种 模型 的 预测 效能 ， 研 究 结果 显 
示 ， 三 种 预测 模型 AUC 均 >0.70， 正 确 率 均 >80%， 表 
示 有 具有 较 高 的 准确 性 和 良好 的 预测 能 力 ' ”| 。 训 练 集 
与 测试 集中 SVM 模型 的 各 项 评价 指标 均 高 于 Logistic 回 
归 和 BPNN 模 型 , BPNN 相 比 Logistic 模 型 的 召回 率 较 低 ， 
但 查 准 率 更 准确 。 仅 用 单个 指标 无 法 对 算法 的 效果 进行 
总 体 评价 ， 为 调和 查 准 率 与 召回 率 的 差异 ， 更 加 准确 地 
评价 模型 的 综合 性 能 ， 本 研究 使 用 F1 指数 对 各 模 
型 预测 效果 进行 综合 评价 ， 其 结果 为 BPNN>Logistic 回 
归 , 可 能 与 样本 量 和 变量 数 影响 预测 模型 的 效能 有 关系 ， 
本 研究 中 测试 集 的 预测 数据 量 有 限 ， 限 制 了 BPNN 算法 
的 优势 。 综 合 上 述 指标 ， 基 于 SVM 模型 构建 的 预测 模 
型 具有 良好 诊断 效能 且 更 为 稳定 ， 在 预测 DFUs 复发 方 
面 的 正确 率 、 灵 人 敏 度 和 AUC 等 性 能 指标 上 优 于 其 他 两 
种 模型 ， 提 示 通 过 结合 临床 病例 资料 和 患者 报告 结局 资 
料 所 建立 的 预测 模型 可 作为 有 效 预测 DFUs 复发 的 辅助 
决策 工具 ， 具 有 良好 的 应 用 前 景 。 

机 器 学 习 算法 在 医疗 行业 领域 疾病 诊断 和 健康 风险 
监测 中 的 应 用 发 展 迅 速 ， 基 于 机 咒 学 习 算法 开发 的 预测 
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模型 和 智能 健康 管理 系统 ， 可 以 在 线 对 疾病 复发 第 查 数 
据 的 远程 监测 、 实 时 更 新 和 智能 健康 预警 '” 。 机 器 学 
习 算 法 在 获取 数据 体征 与 分 析 复 杂 数 据 方面 具有 显著 优 
势 ， 从 早期 经 典 的 逻辑 回归 统计 、 决 策 树 分 析 等 传统 方 
法 ， 到 新 兴 的 深度 神经 网 络 学 习 算 法 ， 机 器 学 习 已 被 
广泛 应 用 于 各 个 领域 2) 。SVM 是 机 器 学 习 中 的 常用 算 
法 ， 甚 强大 的 学 习 功 能 发 挥 着 重要 优势 。 代 球 雪 等 ! 1 
采用 SVM、BPNN Logistic 回归 建立 乳腺 癌 复 发 预测 模 
型 ， 结 果 显 示 ，SVM 和 BPNN 模型 具有 更 好 的 预测 性 ， 
本 研究 结果 与 之 相似 。 考 虑 到 DFUs 丰富 的 临床 数据 在 
复发 风险 预测 中 的 重要 意义 ， 若 能 有 效 利 用 上 述 风 险 预 
测 模型 进行 分 析 ， 提 前 控制 高 危 因 素 ， 可 避免 或 延缓 疾 
病 的 不 良 进展 。 此 外 ,不 同 模型 具有 各 自 的 优势 ， 与 
SVM 模型 相 比 ，BPNN 模型 存在 局 部 极 小 值 和 收敛 速度 
慢 等 不 足 ， 与 Logistic 回归 模型 相 比 ，SVM 模型 不 直接 
依赖 于 数据 分 布 ， 而 对 于 多 维 、 非 线性 医疗 数据 ，SVM 
在 分 类 性 能 、 泛 化 能 力 、 建 模 计算 量 等 方面 具有 明显 优 
FL]. Logistic 回归 模型 中 的 回归 系数 虽 可 解释 各 个 影 
响 因 素 的 流行 病 学 意义 ， 但 是 却 无 法 对 存在 严重 共 线性 
的 变量 作出 明确 解释 .231 。 

综 上 所 述 ， 基 于 SVM 的 DFUs 复发 风险 预测 模型 
效果 最 优 ， 运 用 于 DFUs 临床 评估 将 有 助 于 提高 易 复发 
人 和 群 得 查 率 ， 可 以 提前 给 予 复发 风险 预警 ， 利 于 降低 疾 
病 负担 上 且 节 约 医 疗 成 本 ， 为 DFUs 防治 提供 一 定 的 临床 
间 导 和 帮助 。 除 此 之 外 ， 在 临床 科研 方面 ， 通 过 预测 复 
发 风险 实现 对 患者 的 分 组 ， 从 而 控制 组 间 的 可 比 性 。 由 
于 本 研究 仅 关 注 了 DFUs 的 短期 预后 结局 ， 今 后 可 扩充 
样本 量 ,， 纳 入 不 同 地 域 的 人 群 ， 开 展 多 中 心 和 大 样本 的 
队列 研究 ， 探 索 新 的 输入 变量 ， 优 化 模型 准确 度 ， 进 一 
步 验 证 预测 模型 的 效能 。 采 用 多 种 机 器 学 习 算 法 ， 如 决 
策 树 和 随机 森林 等 进行 比较 ， 联 合 预测 以 综合 判断 模型 
的 预测 价值 ， 构 建 更 权威 的 模型 算法 提升 研究 的 准确 性 
和 推广 性 。 

作者 贡献 : 张 娟 提 出 研究 思路 ， 设 计 研 究 方案 ， 研 
究 的 实施 与 可 行 性 分 析 ， 包 括 复 发 风险 预测 模型 建 模 思 
路 ， 数 据 收集 ， 文 章 的 构思 和 论文 撰写 ; 张 娟 、 李 海 芬 ， 
李 小 曼 、 姚 苗 、 马 惠珍 负责 筛选 研究 对 象 ， 数 据 采 集 和 
整理 ， 构 建 预 测 模型 统计 学 处 理 ， 结 果 的 分 析 与 解释 ， 
图 表 的 设计 和 制作 ; 马 强 负责 论文 的 修订 ， 负 责 文 章 的 
质量 控制 及 审 校 ， 提 供 研 究 经 费 及 材料 支持 ， 对 文章 整 
体 负 责 ， 监 督 管理 。 

本 文 无 利益 冲突 。 
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